Компаниите за изкуствен интелект търсят големи печалби от „малки“ езикови модели

Компаниите за изкуствен интелект, които са похарчили милиарди долари за създаване на по този начин наречените огромни езикови модели за зареждане на генеративни AI артикули, в този момент залагат на нов метод за увеличение на приходите: дребни езикови модели.

Apple, Microsoft, Meta и Гугъл неотдавна пуснаха нови AI модели с по-малко „ параметри “ – броят на променливите, употребявани за образование на AI система и оформяне на нейния резултат – само че въпреки всичко с мощни благоприятни условия.

Ходовете са изпитание на софтуерни групи да насърчат възприемането на AI от компании, които имат терзания по отношение на разноските и изчислителната мощ, нужни за ръководство на огромни езикови модели, видът технология, която е в основата на известни чатботове, като например ChatGPT на OpenAI.

Като цяло, колкото по-голям е броят на параметрите, толкоз по-добра е продуктивността на AI софтуера и толкоз по-сложни и нюансирани могат да бъдат неговите задания. Най-новият модел GPT-4o на OpenAI и Gemini 1.5 Pro на Гугъл, и двата оповестени тази седмица, се чака да имат повече от 1tn параметри, а Meta образова версия с 400 милиарда параметри на своя модел Llama с отворен код.

Освен че се борим да убедим някои корпоративни клиенти да заплащат огромните суми, нужни за пускане на генеративни AI артикули, има и опасения по отношение на данните и отговорността за авторски права, които попречват приемането.

Това докара до софтуерни групи като Meta и Гугъл за показване на дребни езикови модели единствено с няколко милиарда параметъра като по-евтини, енергийно ефикасни други възможности с опция за персонализиране, които изискват по-малко сила за образование и работа, които също могат да ограждат чувствителни данни.

„ Като имате толкоз високо качество на точка с по-ниска цена, вие в действителност позволявате на толкоз доста повече приложения за клиентите да влязат и да вършат неща, за които не е имало задоволителна възвръщаемост на тази инвестиция, с цел да оправдаят в действителност да го вършат, ” сподели Ерик Бойд, корпоративен вицепрезидент на Microsoft Azure AI Platform, която продава AI модели на бизнеса.

Гугъл, Meta, Microsoft и френската започваща компания Mistral също пуснаха дребни езикови модели, които демонстрират напреднали благоприятни условия и могат да бъдат по-добре фокусирани върху съответни приложения.

Ник Клег, президент на Meta по световните въпроси, сподели, че новият модел на Llama 3 с параметри от 8 милиарда е съпоставим с GPT-4. „ Мисля, че при съвсем всяко премерване, за което можете да се сетите, виждате великолепно показване “, сподели той. Microsoft сподели, че неговият дребен модел Phi-3 със 7 милиарда параметри превъзхожда GPT-3.5, по-ранна версия на модела на OpenAI.

Малките модели могат да обработват задания локално на устройство, вместо да изпращат информация до облак, което би могло да се хареса на клиенти, загрижени за поверителността, които желаят да подсигуряват, че информацията се съхранява във вътрешните мрежи.

Шарлот Маршал, ръководещ помощник Адълшоу Годард, адвокатска адвокатска фирма, която съветва банки, сподели, че „ един от провокации, които мисля, че доста от нашите клиенти са имали ” при приемането на генеративни AI артикули беше спазването на регулаторните условия за обработка и прекачване на данни. Тя сподели, че по-малките модели дават „ опция за бизнеса да преодолее “ правни и финансови проблеми.

По-малките модели също по този начин разрешават функционалностите на AI да работят на устройства като мобилни телефони. Моделът „ Gemini Nano “ на Гугъл е вграден в най-новия телефон Pixel и най-новия смарт телефон S24 на Samsung.

Apple загатна, че също създава модели с изкуствен интелект, които да работят на своя бестселър iPhone. Миналия месец колосът от Силиконовата котловина пусна своя модел OpenELM, дребен модел, който е планиран да извършва текстови задания.

Бойд от Microsoft сподели, че по-малките модели ще доведат до „ забавни приложения, чак до телефоните и в преносими компютри ”.

Ръководителят на OpenAI Сам Алтман сподели през ноември, че основаната в Сан Франциско започваща компания предлага разнообразни по мярка AI модели на клиенти, които „ обслужват обособени цели “, и ще продължи да основава и продава тези варианти.

„ Има някои неща, при които по-малките модели ще работят в действителност добре “, добави той. „ Вълнувам се за това. “

Въпреки това Алтман добави, че OpenAI ще остане фокусиран върху построяването на по-големи AI модели с увеличени благоприятни условия, в това число способността да разсъждава, възнамерява и извършва задания и в последна сметка да реализира човешки- равнище на просветеност.

„ Има доста моменти, в които мисля, че хората просто желаят най-хубавия модел “, сподели той. „ Мисля, че това е, което хората най-много желаят. “

Допълнителен репортаж от Джордж Хамънд в Сан Франциско

Източник: ft.com